بررسی مشکلات الگوریتم خوشه بندی DBSCAN و مروری بر بهبودهای ارائهشده برای آن
نویسندگان
چکیده مقاله:
Clustering is an important knowledge discovery technique in the database. Density-based clustering algorithms are one of the main methods for clustering in data mining. These algorithms have some special features including being independent from the shape of the clusters, highly understandable and ease of use. DBSCAN is a base algorithm for density-based clustering algorithms. DBSCAN is able to detect clusters with different sizes and shapes in huge amounts of data and is also resistant to noise. Despite its advantages, this algorithm has its own drawbacks such as the difficulty in determining appropriate values for input parameters, inability to detect clusters with different density and inability to detect appropriate clusters when they are too close. Since 1996 that DBSCAN has been introduced, many different algorithms have been proposed as improvements of DBSCAN. In this paper, firstly the drawbacks of DBSCAN algorithm are discussed. Secondly, we review and discuss DBSCAN improvement algorithms in order to know the pros and cons of each algorithm and their success in improving DBSCAN algorithm. We also implemented some of these algorithms according to our studies and tested them according to the clustering evaluation criteria on standard data sets, so that we would to be able to judge the algorithms better.
منابع مشابه
الگوریتم ژنتیک آشوب گونه مبتنی بر حافظه و خوشه بندی برای حل مسائل بهینه سازی پویا
چکیده: اکثر مسائل موجود در دنیای واقعی یک مسئله بهینهسازی با ماهیتی پویا هستند، بهطوریکه مقدار بهینه سراسری آنها در طول زمان ممکن است تغییر کند، بنابراین برای حل این مسائل الگوریتمهایی نیاز داریم که بتوانند خود را با شرایط این مسائل بهخوبی سازگار نموده و بهینه جدید را برای این مسائل ردیابی نمایند. در این مقاله، یک الگوریتم ژنتیک آشوبگونه مبتنی بر خوشهبندی و حافظه برای حل مسائل پویا ارائ...
متن کاملارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2
One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...
متن کاملاستفاده از خوشه بندی دو مرحلهای برای بررسی تاثیر سهمیه بندی بنزین بر رفتار مصرفکنندگان
بخش حمل و نقل جادهای بزرگترین بخش مصرفکنندهی بنزین در کشور است که با رشد مداوم تقاضای انرژی در طول زمان، در دهههای اخیر با چالشهای بزرگی مواجه بوده است. مهمترین این چالشها، کمبود عرضهی بنزین مصرفی بوده است. برای جبران این کمبود، دولت ناچار به واردات بنزین به مقدار زیاد بوده که اختلاف قیمت خرید و فروش و پرداخت یارانه فشار مالی زیادی بر دولت وارد میکرده است. در گام نخست دولت در تیر ماه س...
متن کاملارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...
متن کاملبهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)
Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 6 شماره 1
صفحات 2- 37
تاریخ انتشار 2017-05
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023